视觉Token竞赛:智谱与DeepSeek的“撞车”之争 以128k token窗口为例,传统长文本处理单轮算力成本近0.2元、延迟达数秒,而两款模型通过“文本→高密度图像→视觉Token”三级压缩,将30页文档压进100个视觉Token,压缩率达10-60倍。 飞轮 视觉 deepseek token token竞赛 2025-10-24 00:53 3